您现在的位置是:立马万言网 > 综合
连夜研究,美股震荡,DeepSeek到底干了什么?
立马万言网2025-01-31 16:55:51【综合】5人已围观
简介出品 | 网易科技态度栏目作者 | 袁 宁编辑 | 丁广胜DeepSeek给全世界人民,拜!年!了!当DeepSeek从登顶中美应用商店免费榜,蔓延到成为X、微博、小红书的热门话题,这场关于AI的
出品 | 网易科技态度栏目
作者 | 袁 宁
编辑 | 丁广胜
DeepSeek给全世界人民,拜!震荡年!到底了!连夜
当DeepSeek从登顶中美应用商店免费榜,蔓延到成为X、到底微博、连夜小红书的研究热门话题,这场关于AI的美股狂欢也逐渐从技术范畴,走到了国运叙事。震荡网友纷纷戏称“建议连夜安排DeepSeek上春晚”。到底
春晚可能是赶不上彩排了,但这个年无疑难忘今宵。
(黑神话悟空制作人冯骥表示DeepSeek为国运级别的科技成果)
事情从DeepSeek发布新模型起,经过中美再次对账,美国芯片封锁好像不仅没起到作用,反而激发了中国的创新?
一时间,各大主流媒体开始跟进,铺天盖地的报道下,持续看涨的英伟达股价大跌。
一众大佬开始现身评价:特朗普表示DeepSeek给美国人工智能产业敲响了警钟,ScaleAI创始人则暗戳戳表示中国人太努力,meta更是连夜成立四个专项小组研究其技术原理……
(《华尔街日报》:硅谷对中国制造的人工智能模型赞不绝口)
(《纽约时报》:DeepSeek是如何颠覆人工智能的)
(《时代杂志》:DeepSeek引发股市混乱)
DeepSeek是什么?为什么是它让硅谷科技大佬集体破防?它又凭什么造成了美股的震荡?你需要知道这些:
一、DeepSeek是什么?
简单来说,DeepSeek是一家中国的人工智能研究公司。旗下产品为DeepSeek,可以在PC端和移动端使用。
首先,区别于硅谷AI企业依赖明星科学家的模式,DeepSeek核心团队不到150人,没有“明星”,也没有“海归”,人才构成完全本土。
创始人梁文锋,80后,本硕均毕业于浙江大学。他曾透露,DeepSeek员工都是一些Top高校的应届毕业生、没毕业的博四、博五实习生,还有一些毕业才几年的年轻人。此前,雷军以千万年薪招揽的95后“天才AI少女”罗福莉,就曾是DeepSeek的团队成员。
此外,背靠量化私募公司幻方量化,DeepSeek至今没有融资,完全靠自有资金运行。同时,它也是国内除大厂外,唯一拥有万张A100芯片的公司。
( 2019年,梁文锋在金牛奖颁奖仪式上,发表主题演讲《一名程序员眼里中国量化投资的未来》,当时幻方管理的资金规模就已破百亿。)
二、AI界的“拼多多”,让硅谷连夜查账
宣称能力可以对标GPT系列的模型并不少,为什么偏偏是DeepSeek让硅谷AI圈集体大破防?
核心在于其极致低价的模型成本。
据介绍,对标GPT-4o的模型DeepSeek-V3,仅使用了2000块英伟达芯片,训练成本不到558万美元,是同类模型的1/10。
要知道,OpenAI给特朗普画的”星际大饼“可是价值5000万美元。
Meta内部员工更是吐槽:“我们一个高管的年薪就够训练整个DeepSeek模型了,而这样的高管我们有几十个,公司怎么向股东交代?“
其实,早在这次产生爆炸影响力之前,DeepSeek就已经凭借其极致性价比,在去年5月出圈。获得“AI界拼多多”称号的同时,也带动国内大厂打起了大模型价格战。
但值得注意的是,区别于赔钱换流量的模式,DeepSeek在低价的同时仍然保持盈利。
梁文锋曾介绍:我们只是按照自己的步调来做事,然后核算成本定价。我们的原则是不贴钱,也不赚取暴利。这个价格也是在成本之上稍微有点利润。
三、算力神话破灭?华尔街估值地震
而DeepSeek能够保持低成本的原因,则在于其架构创新。
其首创MLA(多头潜在注意力机制)与DeepSeekMoE架构,将显存占用降至传统模型的5%-13%,并通过强化学习实现“无监督推理突破”——模型可自主反思纠错,甚至展示数万字思维链。
换句话说,仅用很少的AI芯片,通过算力效率提高,模型也能实现同样的智能。打破AI产业对芯片依赖迷信的同时,也无疑给那些认为仅靠巨额资金就能遏制竞争的巨头们,当头一棒。
正因如此,DeepSeek-R1发布次日,英伟达、博通股价分别暴跌16.9%和17.4%,微软、谷歌跟跌,欧洲ASML、西门子能源跌幅超7%。
四、挑战OpenAI霸权,用开放击穿闭源护城河
此外,DeepSeek更是将代码、训练方法、论文全部公开,并在MIT协议下允许商业应用。
在”X“上我们已经可以看到伯克利、港科大等学生已用几十美元成功复现模型,被英伟达科学家称为“非美国公司践行OpenAI初心”。
(伯克利博士用DeepSeek复现模型能力)
要知道,OpenAI的API定价几乎为DeepSeek的30倍,而DeepSeek应用更是当前唯一支持免费联网与深度思考的模型。试问什么会比免费更香?
——DeepSeek的开源生态直接动摇了硅谷“闭源垄断——高额订阅”的盈利逻辑。正如深度学习之父杨立昆所言:“这不是中美之争,而是开源对闭源的超越”。
以上就是,DeepSeek此次引起巨大反响的原因。
One More Thing
更令人惊喜的是,更多人看到了DeepSeek具备的“本土灵魂”。借着年味,小红书上的用户已经开始尝试用DeepSeek写诗,写春联。
(Midjourney创始人使用DeepSeek之后的评价)
而DeepSeek能够带来的惊喜显然不止于此,就在今天除夕,DeepSeek再次推出新模型。
辞旧迎新,2025年的AI江湖,好戏刚刚开场。期待中国科技早日从“追赶叙事”走向“定义叙事”。
延伸阅读很赞哦!(58)
站长推荐
友情链接
- 雅安市市场监管局督查春节期间碧峰峡旅游景区安全工作
- 字节跳动成立新部门发力AI应用层 新产品正开发中
- 兰博基尼新款SUV曝光:搭载卡宴引擎 预计2024年正式发布
- 履新的第一个除夕,市委书记李酌心系这些人和事……
- 魅族也开始研发汽车了!购买魅族21的用户可原价抵扣!
- 雅安市人民代表大会常务委员会任职名单
- 美德滋养厚土 家风浸润心田
- OpenAI推迟至2024年上线GPT商城 因“过分忙碌”!
- 字节跳动成立新部门发力AI应用层 新产品正开发中
- 政协雅安市第四届委员会常务委员会关于四届市政协委员增补和请辞事项的决定
- 一加12采用“四方深度调优”方案:玩《原神》两小时几乎全程满帧!
- 街头春意浓 市民赏花忙
- 孝心感天动地 创造生命奇迹
- 解决顽疾 中小卫浴企业三步升级“战斗力”
- 非凡性能 统治全场:海盗船 DOMINATOR TITANIUM统治者泰坦DDR5内存
- 一老人骑行不慎卡脚 消防人员及时救援
- 员工称亚马逊AI机器人Q“幻觉”严重 且泄露公司机密
- 做好巡线工作 保障村民可靠用电
- 做好巡线工作 保障村民可靠用电
- 做好巡线工作 保障村民可靠用电
- 国内显卡商陆续下架 英伟达或将开发中国特供RTX4090
- 问界M9盲订已超33000台:定位1000万以内最好的SUV!
- 中国·雅安大数据产业园7、8号楼封顶
- 华为智界S7电车现已开售:续航高达855km!24万元起!
- 兰博基尼新款SUV曝光:搭载卡宴引擎 预计2024年正式发布
- 苹果正布局6G研发!5G芯片未取消 但开发重心调整
- 雅安市市场监管局督查春节期间碧峰峡旅游景区安全工作
- 华为智界S7电车现已开售:续航高达855km!24万元起!
- 【氪新每周看】《如龙7外传》桐生的回归与告别
- 雅安市老年大学大兴校区投用
- 一加12采用“四方深度调优”方案:玩《原神》两小时几乎全程满帧!
- 警惕电子烟成为青少年“第一口烟”
- 苹果新版CarPlay再次延期推出 或与车厂开放程度有关
- 担当作为 守牢底线 确保全市人民平安欢乐祥和过节
- OpenAI推迟至2024年上线GPT商城 因“过分忙碌”!
- 两台组网轻松覆盖140㎡ 华硕灵耀AX小魔方Pro路由器双12优惠到手仅需379元
- 中国·雅安大数据产业园7、8号楼封顶
- OpenAI推迟至2024年上线GPT商城 因“过分忙碌”!
- 神木垒千人冰雪徒步迎冬奥
- 黄仁勋:AI或5年内赶超人类 回忆马斯克买AI超级计算机